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0 Proced6 et dlspositif de synthase de la parole par addition-recouvrement de formes d'onde. 



0 La synthese de parole est effectuee h partir 
dements tels que des diphones. On effectue, au 
moins sur les sons vois^s des Elements sonores, 
une analyse par fen§trage sensiblement centre sur 
le debut de chaque reponse impulsionnelle du 
conduit vocal h ['excitation des cordes vocales a 
I'aide d'une fenetre de fiitrage presentant une ampli- 
tude decroissant jusqu'Jt zero aux bords de la fen§- 
tre de largeur au moins egale k deux fols la periode 
fondamentale d'origine ou deux fois la periode fon- 
damentale de synthase, on replace les signaux re- 
sultant du fenetrage correspondant k chaque eie- 
t- ment sonore, avec un ddcalage temporel de ceux-ci 
^egal a la periods fondamentale de synthase, inte- 
jyjrieure ou superieure k la periods fondamentale d'ori- 
<v)gine, suivant Tinformation prosodique concernant la 
W frequence de synthase, on effectue la synthase par 
^sommation des signaux ainsi decays. 
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Procede et disposrtif de synthase de la parole par addition-recouvrement de formes d'onde. 



L'invention concerns les procedes et dispositifs 
de synthase de la parole ; eile conceme, plus 
particulierement, la synth&se k partir d'un diction- 
naire d'elements sonores par d£coupage du texte k 
synthetiser en microtrames identifies chacune par 
un numero d'ordre d'element sonore correspondant 
et par des param&tres prosodiques (information de 
hauteur de son au d£but et a la fin de I'element 
sonore et duree de I'etement sonore). puis par 
adaptation et concatenation des elements sonores 
par une procedure d'addition-recouvrement. 

Les elements sonores stockes dans le diction- 
naire seront frequemment des diphones, c'est-&- 
dire des transitions entre phonemes, ce qui per- 
met. pour la langue frangaise, de se contenter d'un 
dictionnaire d'environ 1300 elements sonores ; on 
peut cependant utiliser des elements sonores diffe- 
rents. par exemple des syllabes ou meme des 
mots. Les param&tres prosodiques sont determines 
en fonction de entires portant sur le contexte : la 
hauteur de son qui correspond a ('intonation, de- 
pend de Pemplacement de I'Slement sonore dans 
un mot et dans la phrase et la duree donnee k 
('element sonore est fonction du rythme de la phra- 
se. 

II taut rappeler au passage que les methodes 
de synthase de la parole se subdivisent en deux 
groupes. Celles qui utilisent un mod&le matftemati- 
que du conduit vocal (synthase par prediction li- 
neaire, synthese k formants et synthase k transfor- 
med de Fourier rapide) font intervenir une decon- 
volution de la source et de la fonction de transfert 
du conduit vocal et exigent en general une cin- 
quantaine d'op^rations arithnrtetiques par echantil- 
lon nunterique de la parole avant conversion 
numerique-analogique et restitution. 

Cette deconvolution source-conduit vocal per- 
met d'une part la modification de la valeur de la 
frequence fondamentale des sons voises, e'est- 
a-dire des sons qui ont une structure harmonique 
et sont provoquSs par vibration des cordes vocales, 
et d' autre part la compression des donnees repre- 
sentant le signal de parole. 

Celles qui appartiennent au second groupe de 
proc£d§s utilisent la synthase dans le domains 
temporel par concatenation de formes d'onde. Cet- 
te solution a I'avantage de la flexibility d'emploi et 
de la possibility de rdduire consid£rablement ie 
nombre d'opgrations arithntetiques par gchantillons. 
En contrepartie, eile ne permet pas de reduire le 
d§bit n^cessaire k la transmission autant que les 
methodes basees sur un mod&le matttematique. 
Mais cet inconvenient disparatt lorsqu'on recherche 
essentiellement une bonne quality de restitution 
sans §tre a§n6 oar la nScessite de transmettre des 



donnees sur un canal etroit. 

La synthese de parole suivant la presente in- 
vention appartient au second groupe. Eile trouve 
une application particuli&rement importante dans le 

5 domaine de la transformation d'une chaTne ortho- 
graphique (constitute par exemple par le texte 
fourni par une imprimante) en un signal de parole, 
par exemple restitue directement ou emis sur une 
ligne telephonique normale. 

w On connait deja (Diphone synthesis using an 

overlap-add technique for speech waveforms 
concatenation. CHARPENTIER et al, ICASSP 1986, 
IEEE-IECEJ-ASJ International Conference on 
Acoustics Speech and Signal Processing, pages 2 

15 015-2 018)un procSde de synthase de parole k 
partir d'elements sonores utilisant une technique 
d'addition-recouvrement de signaux a court-terme. 
Mais il s'agit de signaux k court-terme de synthe- 
se, avec normalisation du recouvrement des fene- 

20 tres de synthase, obtenus par un processus tres 
complexe : 

- analyse du signal original par fenetrage synchro- 
ne du voisement ; 

- transform^ de Fourier du signal k court-terme ; 
25 • detection d'enveloppe ; 

- homothetie de I'axe frequentiel sur le spectre de 
la source ; 

- pondtration du spectre modifie de la source par 
i'enveioppe du signal d'origine ; 

30 - transformee de Fourier inverse. 

La presente invention vise notamment a fournir 
un procede relativement simple et permettant une 
reproduction acceptable de la parole. Eile part de 
Phypothdse qu'on peut considerer les sons voises 

35 comme la somme des r^ponses impulsionnelles 
d'un filtre, stationnaire durant plusieurs millisecon- 
des, (correspondant au conduit vocal) excite par 
une suite de Dirac, c'est-&-dire par un "peigne 
d'impulsions", de fagon synchrone de la frequence 

40 fondamentale de la source, e'est-a-dire des cordes 
vocales, ce qui se traduit dans le domaine spectral 
par un spectre harmonique, les harmoniques etant 
espaces de la frequence fondamentale et ponderts 
par une enveloppe presentant des maxima appeies 

46 formants, dependant de la fonction de transfert du 
conduit vocal. 

On a d&\k propose (Micro-phonemic method of 
speech synthesis, Lucaszewic et al, ICASSP 1987, 
IEEE, pages 1428-1429) d'effectuer une synthase 

so de parole ou la diminution de la frequence fonda- 
mentale des sons voises, lorsqu'elle est nScessaire 
pour respecter des donntes prosodiques, est ef- 
fective par insertion de zeros, les microphon&mes 
stockes devant alors obiigatoirement correspondre 
k la hauteur maximale oossible du son k restituer, 
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ou bien (brevet US 4 692 941) de diminuer de la 
meme manidre par insertion de zeros la frequence 
fondamentale. et d'augmenter celle-ci en diminuant 
la taille de chaque periode. Ces deux methodes 
introduisent sur le signal de parole des distorsions 
non negligeables lors de ia modification de la fre- 
quence fondamentale. 

La presente invention vise k fournir un proced§ 
et un dispositif de synthese k concatenation de 
formes d'onde ne presentant pas la limitation ci- 
dessus et permettant de fournir une parole de 
bonne qualite, tout en ne necessitant qu'un faible 
volume de calculs arithm&iques. 

Dans ce but, I'invention propose notamment un 
precede caracteris6 en ce que : 

- on effectue. au moins sur les sons voises des 
elements sonores, un fenetrage centre sur le debut 
de chaque reponse impulsionnelle du conduit vocal 
a I'excitation des cordes vocales (ce debut pouvant 
etre memorise dans un dictionnaire) k I'aide d'une 
fenetre presentant un maximum pour ledit debut et 
une amplitude decroissant jusqu'S zero au bord de 
la fenetre. et 

- on replace les slgnaux fenetres correspondant a 
chaque element sonore avec un decalage tempore! 
egal a la periode fondamentale de synthase a 
obtenir, inferieur ou superieur a la periode fonda- 
mentale d'origine suivant 1'information prosodique 
de hauteur de la frequence fondamentale et on 
effectue une sommation de ces signaux. 

Ces operations constituent la procedure de re- 
couvrement puis addition des formes d'onde ele- 
mentaires obtenues par fenetrage du signal de 
parole. 

En general, on utilisera des elements sonores 
constituSs par des diphones. 

La largeur de la fenetre peut varier entre des 
valeurs inf^rieures et superieures k deux fois la 
periode d'origine. Dans Texemple de mise en oeu- 
vre qui sera d6crit plus loin, la largeur de la fenetre 
est choisie avantageusement egale k environ deux 
fois la periode d'origine en cas d'augmentation de 
la periode fondamentale ou environ deux fois la 
periode finale de synthase en cas d'augmentation 
de la frequence fondamentale. afin de compenser 
partiellement les modifications d'Snergie dues au 
changement de la* frequence fondamentale. non 
compensees par une normalisation possible de 
l'6nergie. tenant compte de la contribution de cha- 
que fenetre k I'amplitude des echantillons du signal 
numerique de synthese : dans le cas d'une. diminu- 
tion de la periode fondamentale. la largeur de la 
fenetre sera done infSrieure a deux fois la periode 
fondamentale d'origine. II est peu souhaitable de 
descendre au dessous de cette valeur. 

Du fait qu'il est possible de modifier la valeur 
de la frequence fondamentale dans les deux sens, 
les diphones sont memorises avec la frequence 



fondamentale naturelle du locuteur. 

Avec une fen§tre de duree egale k deux perio- 
des fondamentales consecutives dans le cas voise. 
on obtient des formes d'onde elementaires dont le 

5 spectre represente sensiblement J'enveloppe du 
spectre du signal de parole ou spectre k court 
terme large bande -du fait que ce spectre est 
obtenu par convolution du spectre harmonique du 
signal de parole et de la reponse frequentielle de la 

w fen§tre, qui dans ce cas possede une largeur de 
bande superieure k la distance entre harmoniques- 
; la redistribution temporelle de ces formes d'onde 
elementaires donnera un signal possSdant sensi- 
blement la meme enveloppe que le signal d'origine 

/s mais une distance entre harmoniques modifiee. 

Avec une fenetre de duree superieure k deux 
periodes fondamentales. on obtient des formes 
d'onde elementaires dont le spectre est encore 
harmonique, ou spectre k court terme bande etroi- 

20 te -du fait que cette fois-ci la reponse frequentielle 
de la fenetre est moins large que la distance entre 
harmoniques- ; la redistribution temporelle de ces 
formes d'onde elementaires donnera un signal pos- 
sedant, comme le signal de synthase precedent, 

25 sensiblement la meme enveloppe que le signal 
d'origine a ceci prhs qu'on aura introduit des ter- 
mes de reverberation (signaux dont le spectre pos- 
sede une amplitude moindre. une phase differente, 
mais la meme forme que le spectre d'amplitude du 

30 signal d'origine), dont I'effet ne sera audible qu'au 
6e\k de largeurs de fenetre d'environ trojs perio- 
des, cet effet de reverberation ne degradant pas ia 
qualite du signal de synthese lorsque son amplitu- 
de est faible. 

35 On peut notamment utiliser une fendtre de 
Hanning. bien que d'autres formes de fen§tre 
soient egalement acceptables. 

Le traitement defini ci-dessus peut egalement 
etre applique aux sons dits sourds ou non voises. 

40 pouvant etre representes par un signal dont la 
forme s'apparente k celle d'un bruit blanc, mais 
sans synchronisation des signaux fendtres : ceci a 
pour but d'homogeneiser le traitement sur les sons 
sourds et les sons voises, ce qui permet d'une part 

45 le lissage entre elements sonores (diphones) et 
entre phonemes sourds et voises, et d'autre part 
une modification du rythme. II se pose un probfe- 
me k la jonction entre diphones. Une solution pour 
ecarter cette difficulte consiste k omettre I'extrac- 

50 tion de formes d'onde elementaires k partir des 
deux periodes fondamentales adjacentes de transi- 
tion entre diphones (dans le cas des sons sourds, 
les marques de voisement sont remplacees par 
des marques posees arbitrairement) : on pourra 

55 soit definir une troisi&me fonction d'onde eiemen- 
taire en calculant la moyenne des deux fonctions 
d'onde elementaires extraites de part et d'autre du 
diphone, soit utiliser la procedure d'addition-recou- 
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vrement directement sur ces deux fonctions d'onde 
elementaires. 

^invention sera mieux comprise k la lecture de 
la description qui suit d'un mode particulier de 
mise en oeuvre de Tinvention, donne k titre 
d'exemple non limitatif. La description se refere 
aux dessins qui Taccompagnent, dans lesquels : 

- la Figure 1 est un graphe destine a illustrer 
ia synthase de la parole par concatenation de 
diphones et modification des parametres prosodi- 
ques dans le domaine temporel. conformement k 
Tinvention ; 

• la Figure 2 est un schema synoptique 
montrant une constitution possible du dispositif de 
synthase, implante sur un calculateur hote ; 

- la Figure 3 montre, k titre d'exemple. com- 
ment on modifie les param&tres prosodiques d'un 
signal naturel, dans le cas d'un phonfeme particulier 

* 

- les Figures 4A. 4B et 4C sont des graphi- 
ques destines a montrer des modifications spectra- 
les apportees k des signaux de synthase voises, ia 
Rgure 4A montrant le spectre d'origine, la Figure 
46 le spectre avec diminution de la frequence 
fondamentale et la Figure 4C le spectre avec aug- 
mentation de cette frequence ; 

- la Rgure 5 est un graphique montrant un 
principe d'attenuation des discontinuites entre di- 
phones ; 

- fa Figure 6 est un schema montrant le 
fenetrage sur plus de deux periodes. 

La synthase d'un phonSme est effectuee a 
partir de deux diphones stockes dans un dictionnai- 
re. chaque phoneme 6tant compose de deux demi- 
diphones. Le son "e" dans "periode" par exemple 
sera obtenu a partir du second demi-diphone de 
"pai" et du premier demi-diphone de "air". 

Un module de traduction orthographique pho- 
n&ique et de caicui de la prosodie (qui ne fait pas 
partie de Tinvention) fournit k un instant donne. des 
indications identifiant : 

- le phon£me k restituer, d'ordre P 

• le phoneme pr£c6dent, d'ordre P-1 

- le phoneme suivant, d'ordre P + 1 

et donnant la duree k affecter au phoneme P ainsi 
que les periodes au d£but et k la fin (Rgure 1). 

Une premi&re operation d'analyse, qui n'est 
pas modifiee par Tinvention, consiste k determiner, 
par d£codage du nom des phonemes et des indi- 
cations prosodiques, les deux diphones retenus 
pour le phoneme k utiliser et le voisement. 

Tous les diphones disponibles (au nombre de 
1300 par exemple) sont m6moris€s dans un die- 
tionnaire 10 muni d'une table constituant le des- 
cripteur 12 et contenant I'adresse du ddbut de 
chaque diphone (en nombre de blocs de 256 oc- 
tets) ia longueur du diphone et le milieu du dipho- 
ne (ces deux demiers parametres etant exprirttes 



en nombre d'Schantillons k partir du d6but) et des 
marques de voisement reperant le debut de la 
reponse du conduit vocal k Texcitation des cordes 
vocales dans le cas d'un son voise (au nombre de 

s 35 par exemple). Des dictionnaires de diphones 
repondant k ces criteres sont disponibles par 
exemple aupres du Centre National d'Etudes des 
Telecommunications. 

Les diphones sont alors utilises dans un pro- 

w cessus d'analyse et de synthese schematise sur la 
Rgure 1. On decrira ce processus en supposant 
qu'il est mis en oeuvre dans un dispositif de syn- 
thase ayant la constitution montree en figure 2, 
destine a etre relie k un calculateur hote. tei que le 

is processeur central d'un ordinateur personnel. On 
supposera £galement que la frequence d'echantil- 
lonnage donnant la representation des diphones 
est de 16 kHz. 

Le dispositif de synthase (Figure 2) comporte 

20 alors une nrtemoire vive principale 16 qui contient 
un micro-programme de caicui, le dictionnaire de 
diphones 10 (e'est-a-dire des formes d'onde repre- 
sentees par des echantillons) ranges dans Tordre 
des adresses du descripteur, la table 1 2 constituant 

25 le descripteur de dictionnaire, et une fenetre de 
Hanning, Schantillopnee par exemple sur 500 
points. La nrtemoire vive 16 constitue egalement 
memoire de micro-trame et memoire de travail. 
Efle est reliee par un bus de donnees 18 et un bus 

30 d'adresses 20 a un acc&s 22 au calculateur hote. 

Chaque micro-trame emise pour restituer un 
phonfeme (Rgure 2) est constitute, pour chacun 
des deux phon&mes P et P + 1, qui interviennent 

- du nunrtero d'ordre du phonfeme, 

35 - de la valeur de la periode au debut du phoneme, 
de la valeur de periode k la fin du phoneme, et 

- de la dur£e totale du phoneme pouvant §tre 
remplacee par la duree du diphone pour le second 
phonSme. 

40 Le dispositif comprend encore, relies aux bus 
18 et 20, une unite de caicui locale 24 et un circuit 
d'aiguillage 26. Ce dernier permet de relier une 
memoire vive 28 servant de tampon de sortie soit 
vers le calculateur, soit vers un controleur 30 de 

45 convertisseur nurrterique/analogique 32 de sortie. 
Ce dernier attaque un filtre passe-bas 34, generale- 
ment limite k 8 kHz, qui aiimente un amplificateur 
de parole 36. 

Le fonctionnement du dispositif est le suivant. 

so Le calculateur hote (non represent^) charge les 
micro-trames dans le tableau rSservS en memoire 
16, par Tinterrrtediaire de Tacc&s 22 et des bus 18 
et 20, puis il commande le debut de synthase k 
Tunite de caicui 24. Cette unite de caicui recherche 

55 le nunrtero du phonfcme courant P, du phon§me 
suivant P + 1 et du phonfeme pr6c6dent P-1 dans le 
tableau de micro-trames, k Taide d'un index rrte- 
morisS dans la rrtemoire de travail, initialise k 1. 
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Oans le cas du premier phoneme, Tunite de calcul 
vient chercher uniquement les numeros du phone- 
me courant et du phoneme suivant. Dans le cas du 
dernier phoneme, elle vient chercher le numero du 
phoneme precedent et celui du phoneme courant. 

Dans le cas general, un phon&me est constitue 
de deux demi-diphones ; Padresse de chaque di- 
phone est recherchee par adressage matriciel dans 
le descripteur du dictionnaire par la formule suivan- 
te : 

numero du descripteur de diphone - 

numero du 1er phon&me + (numero du 26me 

phonfeme-1)'nombre de diphones 

Sons voises 



L'unite de calcul charge, en m£moire de travail 
16, I'adresse du diphone, sa longueur, son milieu 
ainsi que les trente-cinq marques de voisement 
Elle charge ensuite, dans un tableau descripteur du 
phon&me. les marques de voisement correspon- 
dant k la deuxifeme partie du diphone. Puis elle 
recherche, dans ie dictionnaire de formes d'onde. 
la deuxfeme partie du diphone, qu'elle place dans 
un tableau representant le signal du phoneme 
d'analyse. Les marques conservees dans le ta- 
bleau descripteur du phon&me sont decr6ment6es 
de la valeur du milieu du diphone. 

Cette operation est repetee pour la deuxieme 
partie du phonfeme constituee par la premiere par- 
tie du deuxi&me diphone. Les marques de voise- 
ment de la premifere partie du deuxieme diphone 
sont ajoutees aux marques de voisement du pho- 
neme et incrementees de la valeur du milieu du 
phoneme. 

Dans le cas des sons voises, l'unite de calcul, 
k partir des param&tres prosodiques (durSe, perio- 
de debut et periode fin du phoneme) determine 
alors le nombre de periodes necessaire k la duree 
du phoneme, suivant la formule : 
nombre de periodes = 2*dur6e du phoneme / 
(periode debut + periode fin) 

L'unite de calcul range en m^moire le nombre 
de marques du phoneme naturel, egal au nombre 
de marques de voisement, puis determine le nom- 
bre de periodes k eiiminer ou a ajouter en effec- 
tuant la difference entre le nombre de periodes de 
synthese et ie nombre de periodes d'analyse, diffe- 
rence qui est fixSe par la modification de tonalite k 
introduire k partir de celle qui correspond au dic- 
tionnaire. 

Pour chaque periode de synthase retenue, 
Punite de calcul determine ensuite la periode 
d'analyse retenue parmi les periodes du phonfeme 
k partir des considerations suivantes : 
- ta modification de la duree peut §tre consider 
comme la mise en correspondance. par dSforma- 
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tion de Paxe des temps du signal de synthase, des 
n marques de voisement du signal d'analyse et 
des p marques du signal de synthese, n et p etant 
des entiers predetermines ; 
5 - a chacune des p marques du signal de synthase 
doit etre associee la marque la plus proche du 

signal d'analyse. 

La duplication ou, au contraire, {'elimination de 
periodes egalement reparties sur tout le phoneme 
io modifie la duree de ce!ui-ci. 

II faut noter qu'on n'aura pas k extraire une 
forme d'onde elementaire k partir des deux perio- 
des adjacentes de transition entre diphones : Tope- 
ration d'addition-recouvrement des fonctions ele- 
75 mentaires extraites des deux derni&res periodes du 
premier diphone et des deux premieres periodes 
du deuxfeme diphone permet le lissage entre ces 
diphones comme le montre la figure 5. 

Pour chaque periode de synthase, l'unite de 
20 calcul determine le nombre de points a ajouter ou 
a supprimer k la periode d'analyse en effectuant la 
difference entre cette derniere et la periode de 
synthase. 

Comme on Pa indique plus haut, il est avanta- 
25 geux de choisir ta largeur de la fenetre d'analyse 
de la fagon suivante, illustree en Figure 3 : 

- si la periode de synthase est inferieure k la 
periode d'analyse (lignes A et B de la Figure 3). la 
taille de la fenetre 38 est le double de la periode 

30 de synthase ; 

- dans le cas contraire, la taille de la fenetre 40 est 
obtenue en multipliant par deux la plus faible des 
valeurs de la periode d'analyse courante et de la 
periode d'analyse precedente (lignes C et D). 

35 L'unite de calcul determine un pas d'avance- 
ment dans la lecture des valeurs de la fenetre, 
tabulae par exemple sur 500 points, le pas etant 
alors egal k 500 divise par la taille de la fenetre 
prec£demment calcuiee. Elle lit dans la m£moire 
40 tampon de signal du phoneme d'analyse 28 les 
gchantillons de la periode precedente et de la 
periode courante. les pond&re par la valeur de la 
fen§tre de Hanning 38 ou 40 indexee par le nume- 
ro de I'echantillon courant multiplie par le pas 
45 d'avancement dans la fenetre tabulee et ajoute. au 
fur et k mesure, les valeurs calcuiees a la memoire 
tampon du signal de sortie indexe par la somme 
du compteur de Pechantillon courant de sortie et 
de Pindex de recherche des echantillons du phone- 
so me d'analyse. Le compteur de sortie courant est 
ensuite incremente de la valeur de la periode de 
synthase. 

55 Sons sourds (non voises) 

Pour les phon&mes sourds, le traitement est 
analogue au precedent, excepte que la valeur des 
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pseudo-periodes (distance entre deux marques de 
voisement) n'est jamais modifies : I'elimination de 
pseudo-periodes au centre du phonfeme diminue 
simplement la duree de celui-ci. 

On n'augmente pas la duree de phonemes 
sourds, excepte par addition de zeros au milieu 
des phon&mes "silence". 

Le fenetrage s'effectue par periode pour nor- 
maliser la somme des valeurs des fenetres appli- 
quees au signal : 

- du debut de la periode precedente k la fin de la 
periode precedente, le pas d'avancement dans la 
lecture de la fenetre tabulee est (dans le cas d'une 
tabulation sur 500 points) egal a 500 divise par 
deux fois la duree de la periode precedente ; 

- du debut de la periode courante a la fin de la 
periode courante, le pas d'avancement dans la 
fenetre tabulee est egal a 500 divis4 par deux fois 
la duree de la periode courante plus un decalage 
constant de 250 points. 

A la fin du calcul du signal d'un phonfeme de 
synthese, I'unite de calcul range la derniere perio- 
de du phoneme d'analyse et de synthase dans la 
m^moire tampon 28 qui permet la transition entre 
phonemes. Le compteur de Pechantillon courant de 
sortie est d6cremente de la valeur de la derni&re 
periode de synthese. 

Le signal ainsi g^nere est envoye. par blocs de 
2048 echantillons. dans un de deux espaces me- 
moire reserves a la communication entre Tunite de 
calcul et le controleur 30 du convertisseur 
num^rique/analogique 32. D&s que le premier bloc 
est charge dans la premi&re zone tampon, (e 
controleur 30 est active par i*unite de calcul et vide 
cette premifere zone tampon. Pendant ce temps, 
I'unite de calcul remplit une deuxfeme zone tam- 
pon de 2048 echantillons. L'unite de calcul vient 
ensuite alternativement tester ces deux zones tam- 
pons grace k un drapeau pour y charger le signal 
numdrique de synthase k la fin de chaque sequen- 
ce de synth&se d'un phon&me. Le controleur 30, 
en fin de lecture de chaque zone tampon, position- 
ne le drapeau correspondent. En fin de synthese, 
le controleur vide la derniere zone tampon et posi- 
tionne un drapeau de fin de synthase que le cal- 
culates hote peut lire via i'accfes de communica- 
tion 22. 

L'exemple de spectre de signal de parole voise 
d'analyse et de synthase illustre en Figures 4A-4C 
montre que les transformations temporelles du si- 
gnal num£rique de parole n'affectent pas Tenvelop- 
pe du signal de synthase, tout en modifiant la 
distance entre harmoniques, c'est-£-dire la fre- 
quence fondamentale du signal de parole. 

La complexity du calcul reste faible : le nombre 
d'opgrations par echantillon est en moyenne de 
deux multiplications et deux additions pour la pon- 
d£ration et la sommation des fonctions eiementai- 



res fournies par I'analyse. 

L'invention est susceptible de nombreuses va- 
riantes de realisation et, en particulier. comme on 
Pa indique plus haut, une fenetre de largeur supe- 

5 rieure k deux periodes, comme le montre la Figure 
6. eventuellement de taille fixe, peut donner des 
resultats acceptables. 

On peut aussi utiliser le procede de modifica- 
tion de la frequence fondamentale sur des signaux 

w num£riques de parole en dehors de son application 
a la synthese par diphones. 

Revendications 

1. Procede de synthase de parole k partir 
d'elements sonores (mots, syllabes, diphones ...) 
caracterise en ce que : 

- on effectue, au moins sur les sons voises des 
20 elements sonores, une analyse par fenetrage sensi- 

blement centre sur le debut de chaque reponse 
impulsionneile du conduit vocal a Pexcitation des 
cordes vocales a i'aide d'une fenetre de filtrage 
presentant une amplitude decroissant jusqu'S zero 
25 aux bords de la fenetre dont la largeur est au 
moins egale k deux fois la periode fondamentale 
d'origine ou deux fois la periode fondamentale de 
synthase, 

- on replace les signaux resultant du fenetrage 
30 correspondant k chaque element sonore. avec un 

decalage temporal de ceux-ci egal k la periode 
fondamentale de synthase, inferieure ou superieure 
k la periode fondamentale d'origine, suivant I'infor- 
mation prosodique concernant la frequence fonda- 
35 mentale de synthase, 

- on effectue la synthase par sommation des si- 
gnaux ainsi decales. 

2. Procede de synthase de parole selon la 
revendication 1 , caracterise en ce qu'on realise un 

40 dictionnaire d'eiements sonores, par exemple de 
diphones, on decoupe le texte k synthetiser en 
micro-trames identifiees chacune par le numero de 
I'eiement sonore correspondant (diphone) et au 
moins une information prosodique, constituee au 

45 moins par la vaieur de la frequence fondamentale 
en debut et en fin d'eiement et par la dur6e de 

reiement. 

3. Procede de synthase de parole selon Tune 
des revendications 1 et 2, caracterise en ce que ia 

so largeur de la fenetre est egale k deux fois la 
periode d'origine en cas de diminution de la fre- 
quence fondamentale ou deux fois la periode finale 
de synth&se en cas ^augmentation de la frequen- 
ce fondamentale. 

55 4. Procede de synthase de parole selon Tune 
des revendications 1 k 3, caracterise en ce que la 
fen§tre est une fen§tre de Hanning. 

5. Dispositif de synthase de parole par mise en 
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oeuvre du procede selon la revendication 1 . carac- 
terise en ce qu'il comprend. relics & des bus • 
(18,20) : une memoirs vive principale (16) qui 
contient un micro-programme de calcul, un diction- 
naire de diphones (10) constitues de formes d'onde 5 
representees par des echantillons ranges dans Tor- 
dre des adresses d'un descripteur (12) de diction- 
naire. et une fenetre de Hanning 6chantillonn3e, 
ladite memoire vive (16) constituant 6galement me- 
moire de micro-trame et memoire de travail ; une w 
unite de calcul locale (24) et un circuit d'aiguillage 
(26) permettant de relier une memoire vive (28) 
servant de tampon de sortie soit vers Tunit§ de 
calcul, soit vers un controleur (30) de convertisseur 
numerique/analogique (32) de sortie attaquant un 15 
filtre passe-bas (34) qui alimente un amplificateur 
de parole (36). 
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